新型コロナウィルスに関するデータです。すべてオンラインで最新データが取得できます。
| データ | 区分 | 種別 | 形式 | 言語 | DL | 備考 |
|---|---|---|---|---|---|---|
| 厚生労働省オープンデータ | 公開 | 集計 | CSV | 日本 | 可 | 集計データを個別ファイルで公開 |
| Covid19 Japan | 公開 | 個票・集計 | JSON | 英語 | 可 | GitHubにて |
| JAG Japan | 公開 | 個票 | CSV | 日本 | 可 | GIS処理用データ付き |
新型コロナウィルスに関するデータです。すべてオンラインで最新データが取得できます。
| データ | 区分 | 種別 | 形式 | 言語 | DL | 備考 |
|---|---|---|---|---|---|---|
| 厚生労働省オープンデータ | 公開 | 集計 | CSV | 日本 | 可 | 集計データを個別ファイルで公開 |
| Covid19 Japan | 公開 | 個票・集計 | JSON | 英語 | 可 | GitHubにて |
| JAG Japan | 公開 | 個票 | CSV | 日本 | 可 | GIS処理用データ付き |
日本の公式データ。国内事例(チャーター便、空港検疫などを除く)の各報告日時点の集計(サマリ)値。
厚生労働省のデータはファイルにより単日であったり集計値であったりしますので、サイトの注意書をよく読んでください。
| データ | 特記 |
|---|---|
| 陽性者数 | |
| PCR検査実施人数 | 当日と前日の累積人数の差を当日の実施人数として計上 |
| 入院治療等を要する者の数 | |
| 退院又は治療解除となった者の数 | |
| 死亡者数 | |
| PCR検査の実施件数 | 暫定値であり後日変更される可能性あり |
Exploratory EDA Salonなどで紹介されている有志によるJSON形式データ。個票データ(下表)と集計データに分かれています。全て英語。
GitHub からjsonliteパッケージを利用して読み込んでください。
library(jsonlite)
path <- "https://raw.githubusercontent.com/reustle/covid19japan-data/master/"
path <- paste0(path, "docs/patient_data/")
path %>%
paste0("latest.json") %>%
readr::read_lines() %>%
paste0(path, .) %>%
jsonlite::fromJSON()
個票データへのパスは表示の都合上、分割しています。
各列(変量、フィーチャー)の定義はこちら。
ジャッグジャパンによるGISプロモーションを兼ねて独自に収集・公開している個票データ。集計データは厚生労働省のオープンデータを利用。
特徴的なのはW列(23列)目以降にGIS処理用の変量(フィーチャー)が用意されている点です。これらの変量は分析には必要ありません。
Windows環境ではエラー回避のために下記の guess_maxオプションを指定してください。
readr::read_csv(locale = readr::locale(encoding = "UTF-8"), guess_max = 5000)
各列(変量、フィーチャー)の定義は こちら。
tidyverseパッケージを必ずインストール
readrならびにjsonliteパッケージはtidyverseパッケージに含まれますreadr::read_csv関数で
localeオプションを指定してくださいreadr::write_excel_csv(df, filepath) で書き出せます